深蓝媒体智库沙龙｜三问大模型：流量见顶？越大越好？安全可控？

Original 北京商报北京商报 2023-09-25

收录于合集

#深蓝智库 2 个

#大模型 10 个

#AI 17 个

#科技 2 个

全文共2580字，阅读大约需要6分钟

围绕着大模型产品、技术路线、场景寻找、伦理安全等诸多问题，探寻大模型商业化落地的可行之径。

记者丨杨月涵

从拼参数到讲落地，短短半年时间，大模型经历了一次“神化”，又迅速“接地气”起来。在这轮“百模大战”中，人们越来越笃定，大模型将是比互联网以及移动互联网更大的机会。但在这个过程中，也不可避免地遭遇了技术、安全、商业化模式等方面的诸多挑战，如何跨过这些障碍，找到落地场景，打通商业模式，成为大模型的当务之急。

8月16日，由北京商报社、深蓝媒体智库主办的AI主题沙龙在新闻大厦艺术馆举行，沙龙以“大模型见真章”为主题，围绕着大模型产品、技术路线、场景寻找、伦理安全等诸多问题，探寻大模型商业化落地的可行之径。

会上，北京商报社社长兼总编辑李波涛在致辞中表示，在经济寻求向上突破的当下，几乎唯一没有争议的就是科技，科技可以带来力量。无论是产业还是行业，“破圈”都已形成一个越来越明显的趋势，希望通过深蓝智库的活动，实现产业、行业、人群的“破圈”，将更多前沿的科技成果向更广泛的产业、行业、人群进行传播和输出。

不是泡沫型发展

2023年，大模型接棒元宇宙，成为引爆科技圈的顶流。但半年过去了，由于尚未在产业端形成扎实的应用，人们也不免怀疑，大模型是否会像过去许多人工智能技术那样，数次达到爆发的边缘，但最终往往昙花一现。

对此，百度科技与社会研究中心主任余欢认为，这一波大模型的兴起不是AI概念第一次被热炒，经过70多年发展，人工智能经历了几次起伏，但不同的是，这一波大模型不再是泡沫型发展，而是已经成为当下人工智能的主流方向。

余欢表示，相比起之前的人工智能，这一波大模型的特点是泛化性更强、标准化程度更高、工业化发展趋势更明显。大模型解决的是中长尾的问题，即很多定制化场景无法解决的问题，能够在小样本、小数据的基础上，以相对低成本的情况满足场景化需求。

对于大模型的发展趋势，文渊智库创始人王超用马克·吐温的一句话总结，“历史不会简单地重复，但总是沿着相同的韵脚前行”。回顾整个科技史，从互联网到智能手机，都经历了爆发、泡沫、瓶颈和沉淀，“大模型同样如此，大模型是一个新的科技浪潮，但我觉得它的爆发、泡沫、瓶颈和沉淀期，包括商业化过程，会比互联网、智能手机浪潮更快”。

数据、用户和场景

技术实力并不等于变现能力，商业化是人工智能行业绕不过去的难题，对大模型来说也是如此。围绕着商业化的问题，新壹科技CTO张华伟的看法是：大模型商业化落地需要集齐数据、用户和场景，“商业化是一个长期的过程，一个颠覆性的创新需要打破现有业务去重构，目前国内大模型混战还在起步阶段”。

元语智能联合创始人兼COO朱雷则为大模型的落地概括出了三个关键词：快速、业务和增长。在他看来，当下人们认为大模型难落地，也是因为没有发现有价值的应用。面向企业客户做商业化落地，需要有真实的需求牵引，从用户出发，从需求出发，借用AI技术让业务快速增长。

朱雷解释称，“快速”是因为很多企业等不及，受限于预算、经营环境以及客户需求等问题，企业通常不能花费一两年的时间等待大模型达到GPT4的效果后才考虑落地。“业务”是因为很多模型厂商兜售方案时，其实与其主营业务没有太大关系，只是泛泛而谈的大模型场景，而无法解决具体的业务问题。“增长”则是因为当下很多方案都以“降本增效”为导向，但商业化公司的重点很多时候不在降本，而在增效。毕竟省钱的空间是有限的，只有挣钱才是最重要的事情。

中小微模式有望成主流

动辄千亿规模的参数是过去一段时间，大模型“秀肌肉”的关键之一，但这也延伸出了一个新的探讨，即大模型是不是越大越好？

在技术层面，360智脑产品资深专家葛灿辉认为，中小微模式有望成为国内主流。怎么理解中小微模式？葛灿辉解释，即在保持较高预测准确性的同时，大幅度减小模型的大小和计算成本，优化计算效率，以实现高效的模型预测在较小的设备上运行。

朱雷同样提到，大模型可能会有两大趋势，分别是端云共生以及大小并行。在端云共生方面，目前除了较头部的大模型制造商有云端API外，具体在端侧可能也存在广泛的应用场景，比如工业领域的一些具身智能机器人，以及一些XR眼镜等都可以跑端侧的模型。这种趋势可以概括为从以GPT4为代表的云端API模式慢慢迁移到端云并行的状态。

这也延伸出了第二个预测，大小并行。朱雷解释称，千亿规模的模型一直会存在，甚至可能出现更大量级的模型，但越来越小参数量级的模型可能也会有非常大的应用空间，也就是说要往轻量级模型上发展，能够运行在低端芯片上，并且可以产生不错的效果。

安全、可控、可靠

当下大模型应用方面还会遇到很多风险和挑战，包括幻觉、结果不可控、安全以及歧视、偏见等问题。解决好这些问题，是实现大模型落地的关键前提。

蚂蚁集团大安全AI算法资深专家郑霖表示，大模型只有更安全，在产业应用方面才能更深入更广泛。在新AI时代，蚂蚁集团从四个维度对可信AI做了重新定义，分别为大模型的可靠性、可控性、内容安全及合规以及伦理安全。

除安全问题外，郑霖认为，大模型还需要重视生态的打造，从底层架构，到中间算法，再到上层应用，整体需要各行各业的从业者参与进来，将生态搭建起来。包括芯片短缺和算力等问题，都需要这样一个生态去解决。

葛灿辉则将视角聚焦在了兼容这一问题上。据悉，整个场景布局中的核心是API（应用程序编程接口），这一平台的任务是赋能千行百业、打造开发者业务。

“API主要提供各种能力，比如翻译、对话能力等，简单说就是API接入大模型可以做新应用。”葛灿辉这样介绍基于大模型开发行业应用的过程，“底层是360多个基础大模型，基于底层能力、API开发者工具和360智脑API开放平台，客户可以开发各种行业应用，比如知识管理、医疗问答、智能客服等。”

在葛灿辉看来，API的开放和兼容对快速推进上述流程至关重要。他强调，“API一定要做到开放，360对外对内的API能力完全一致。兼容性在大模型时代也非常关键，360智脑的API和OpenAI的API是完全兼容的，用户只需要改一个API的地址，再改一个API Key，就可以用OpenAI原生的官方客户端调用360智脑的API，所以我们不需要开发客户端，第三方客户端可以直接用，这会让客户接入360智脑的效率大大提升”。

编辑丨汪乃馨
图片丨北京商报

高三女生醉酒后被强奸致死？检方回应

高三女生醉酒后被强奸致死？检方回应

那些内心强大的孩子，童年被允许做过这1件事

波罗的海，电缆断裂！

关晓彤突然官宣喜讯！粉丝欢呼：恭喜啊，终于等到这一天

深蓝媒体智库沙龙｜三问大模型：流量见顶？越大越好？安全可控？

您可能也对以下帖子感兴趣

高三女生醉酒后被强奸致死？检方回应

高三女生醉酒后被强奸致死？检方回应

那些内心强大的孩子，童年被允许做过这1件事

波罗的海，电缆断裂！

关晓彤突然官宣喜讯！粉丝欢呼：恭喜啊，终于等到这一天

生成图片，分享到微信朋友圈

深蓝媒体智库沙龙｜三问大模型：流量见顶？越大越好？安全可控？

您可能也对以下帖子感兴趣